Análise Experimental de Bases de Dados Relacionais e NoSQL no Processamento de Consultas sobre Data Warehouse

نویسندگان

  • Anderson Chaves Carniel
  • Aried de Aguiar Sá
  • Marcela Xavier Ribeiro
  • Renato Bueno
  • Cristina Dutra de Aguiar Ciferri
  • Ricardo Rodrigues Ciferri
چکیده

Data warehouse (DW) is a large, oriented-subject, non-volatile, and historical database, and an important component of Business Intelligence. On DW are executed OLAP (Online Analytical Processing) queries that often culminate in a high response time. Fragmentation of data, materialized views and indices aim to improve performance in processing these queries. Additionally, NoSQL (Not only SQL) database are used instead of the relational database, to improve specific aspects such as performance in query processing. In this sense, in this paper is investigated and compared DW implementations using relational databases and NoSQL. We evaluated the response times in processing queries, memory usage and CPU usage percentage, considering the queries of the Star Schema Benchmark. As a result, the column-oriented model implemented by the software FastBit, showed gains in time of 25.4% to 99.8% when compared to other NoSQL models and relational in query processing. Resumo. Data warehouse (DW) é uma base de dados orientada à assunto, não volátil, histórica e volumosa, sendo um componente importante da inteligência de negócio. Sobre DW incidem consultas OLAP (Online Analytical Processing) que frequentemente culminam em um alto tempo de resposta. Fragmentação de dados, visões materializadas e estruturas de indexação objetivam melhorar o desempenho no processamento dessas consultas. Adicionalmente, banco de dados NoSQL (Not only SQL) são usados como alternativa dos banco de dados relacionais, visando melhorar aspectos específicos, tal como o desempenho no processamento de consultas. Nesse sentido, neste trabalho é investigado e comparado implementações de DW usando banco de dados relacionais e NoSQL. Foram avaliados os tempos de respostas no processamento de consultas, o uso de memória e o uso porcentual de CPU, considerando as consultas do Star Schema Benchmark. Como resultado, o modelo orientado a coluna implementado pelo software FastBit, apresentou ganhos de reduções de tempo de 25,4% a 99,8% se comparado aos outros modelos NoSQL e relacional, no processamento de consultas.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Recomendações para fragmentação horizontal de bases de dados XML

Resumo. A grande quantidade de dados XML disponíveis na Web e dentro das organizações traz consigo um grande desafio no processamento de consultas sobre ambientes distribuídos. Surge então a necessidade da aplicação de técnicas que permitam um processamento de consultas mais eficiente. Neste sentido, técnicas de fragmentação de dados e processamento paralelo de consultas sobre bases de dados di...

متن کامل

Processamento de Consultas XML usando Máquinas de Inferência

Resumo. Processamento de consultas XML sobre grandes bases de dados pode sofrer de problemas de desempenho. Em trabalhos anteriores, mostramos que algumas consultas XML, quando executadas usando uma máquina de inferência, são processadas mais rapidamente do que sua equivalente em XQuery. No entanto, para se beneficiar desse bom desempenho, é necessário traduzir consultas XML para a linguagem ló...

متن کامل

Uso de Anotações Semânticas para Exploração de Paralelismo em Workflows Intensivos em Dados

Applications that analyze large volumes of data are often modeled as interconnected activities (workflows) and executed on high-performance platforms. Data partitioning and replication can make the activities parallelizable. However, to define a model that results in an efficient use of the platform is not trivial. This paper proposes semantic annotations to characterize the data processing in ...

متن کامل

Uso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos

Resumo. Um fator fundamental na gerência de experimentos modelados como workflows científicos são seus dados de proveniência. Esses dados basicamente são usados para garantir a reprodutibilidade, porém nos últimos anos eles também vêm sendo usados para tarefas de monitoramento e escalonamento de atividades. Como essas tarefas demandam consultas em tempo real, conforme a quantidade de dados de p...

متن کامل

Processamento de consultas na Web de Dados: uma abordagem para busca de fontes de dados relevantes

The adoption of Linked Data principles has contributed towards the creation of a Web of Data, allowing the development of applications and tools which run queries over available information. One of the main challenges for the query processing over the Web is the selection of relevant sources, i.e., sources which could contribute significantly to the result of a query. In this paper, we discuss ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012